半滑舌鳎和牙鲆的转录组测序及初步分析

半滑舌鳎和牙鲆的转录组测序及初步分析

作者:师大云端图书馆 时间:2015-08-27 分类:硕士论文 喜欢:3516
师大云端图书馆

【摘要】半滑舌鳎和牙鲆是我国重要的水产养殖品种。这两种鲆鲽鱼雌雄个体的体型和生长速度差异极大,是研究性二态性的理想模型。之前的研究主要集中在遗传标记开发、遗传图谱构建、生长及免疫相关功能基因克隆和性别决定与分化机制等,基因序列信息比较匮乏,到目前为止,NCBI数据库中关于这两种鲆鲽鱼类的EST序列分别只有10,128条和16,275条。近些年来迅速发展的高通量测序技术使得对非模式生物组学水平的研究成为可能。本文利用454焦磷酸测序技术和Illumina测序技术分别对半滑舌鳎和牙鲆进行了转录组测序,并进行了初步分析。1)半滑舌鳎使用454焦磷酸测序技术对6个半滑舌鳎10种组织进行了一个run的测序,总共得到约75万的读序,平均长度为235bp。经过数据预处理后,得到了超过58万的读序,平均长度为206bp,占原始数据的77.9%。使用Newbler对读序进行组装,得到62,632个isotigs,以及未参与组装的98,262个读序作为singlet,将二者聚类得到150,039个序列,作为unigene。isotigs长度范围为100-1,665bp,平均长度为272bp,N50为303bp。isotigs的平均测序深度为10.2。通过利用Blastx与公共蛋白数据库比对,注释了26,569个unigene,占总数的17.7%。在这些注释的序列中,只有349个序列是由已知的鲽形目信息注释的,这说明了公共数据库中鲽形目信息的匮乏。基因语义学(GeneOntology,GO)分析则为3,451个序列注释了17,113个GO词条,其中1,921个序列被注释为细胞组分,3,020个为分子功能,2,561个为生物学途径。KEGG通路分析将2,362个序列富集到186个不同的通路中。通过与RepBase数据库比对,发现1,898个序列中可能存在转座元件,其中包括904个逆转录因子和994个DNA转座子。出现频率最高的逆转录因子是Gypsy(266,29.4%),其次是Jockey(151,16.7%)和Copia(104,11.5%),而在DNA转座子中出现频率最高的依次为CACTA(248,24.9%)、hAT(131,13.2%)和Tcl-Mariner(124,12.5%)。通过筛查序列中可能存在的分子标记,发现了7,869个潜在的微卫星标记、21,234个SNP以及13,370个插入缺失。在所有的微卫星标记中,双碱基重复最多,占64.3%,其次是三碱基重复(31.1%)和四碱基重复(3.5%)。按重复基序来分,AC重复为最常见的重复类型,占20.2%。在三碱基重复和四碱基重复中最常见的分别是CAG重复和AAAC重复。在所有SNP中,包括14,333个转换和6,901个颠换。SNP包括插入缺失平均每491bp出现一次。2)牙鲆利用SolexaRNA-Seq技术对一个双单倍体牙鲆个体进行了转录组测序,获得了超过2,700万的90bp双末端读序。数据预处理后,得到2,400万平均长度为75bp的读序。使用SOAPdenovo和Trinity两种软件对读序进行了拼接。SOAPdenovo软件产生了119,370个scaffold,长度范围为150-9,339bp,平均长度为469bp,总碱基数为56M,其中有11,232个scaffold的长度超过了1kb;Trinity软件产生了97,460个contig,长度范围为201-10,284bp,平均长度为643bp,总碱基数为62.6M,其中有16,211个contig的长度超过了1kb。最终,利用聚类的方法将两组结果合并,得到107,318个非冗余的序列集,平均长度为646bp,总碱基数为69.4M。采用几种不同的方法对组装的序列进行注释。通过Blastx比对,将近一半(51,563,48.1%)的序列获得了注释。GO分析将17,833个序列注释为37,541个GO词条。KEGG分析将7,811个序列富集到310个不同的通路中。经过Blastx注释的序列,其蛋白编码框被预测出来;对于未经注释的序列,利用ESTScan软件预测了5,516个unigene的蛋白编码框。与RepBase数据库的比对发现11,021个unigene中可能存在转座元件,其中包括5,380个逆转录因子和5,641个DNA转座子。Trinity软件分析可变剪切的结果显示,6,941个unigene或许存在可变剪切。从中随机挑选10个,通过克隆测序验证,其中4个确实存在可变剪切。利用双单倍体具有两套完全一致基因组的特点,进行了基因加倍的分析。其中,1,859个unigene代表了牙鲆基因组中具有多个拷贝的基因。
【作者】王文基;
【导师】张全启;
【作者基本信息】中国海洋大学,海洋生物学,2014,博士
【关键词】半滑舌鳎;牙鲆;转录组;454焦磷酸测序;Solexa测序;

【参考文献】
[1]王赟.土地承包经营权入股法律制度研究[D].西南大学,民商法学,2014,硕士.
[2]姜岩.对未来影响最大的六项前沿技术[J].发明与创新(综合科技),2011,07:43.
[3]李研彪,刘毅,李景敏,计时鸣,赵章风.新型拟人机械腿的参数优化[J].中国机械工程,2013,09:1239-1245.
[4]刘津津.有旋流场中黏性液体雾化仿真及其实验研究[D].东北大学,机械设计及理论,2010,硕士.
[5]王遵.P保险公司贷款信用保证保险发展研究[D].云南大学,工商管理,2012,硕士.
[6]傅义程.别隐品碱对兔缺血再灌注心脏跨室壁复极离散度的影响[D].中国人民解放军医学院,老年医学,2013,硕士.
[7]谢江宏,马杰.管理信息化发展方向的思考[J].山西电力,2005,04:63-65.
[8]陈文明,刘成宇,罗维勇,苏冬平.宝钢供应链管理中的需求管理系统[J].宝钢技术,2003,04:20-23+29.
[9]王蕾.论贺绿汀的音乐教育思想[D].浙江师范大学,课程与教学论,2004,硕士.
[10]元小红.中医内外合治强直性脊柱炎的增效研究[D].北京中医药大学,中医学,2014,硕士.
[11]许玫.初任小学语文教师专业发展的参与性调查研究[D].华中师范大学,小学教育,2013,硕士.
[12]陈博.笙硕士研究生毕业设计[D].中国音乐学院,音乐,2014,硕士.
[13]梁林荣.H.264视频编码标准的熵编码研究[D].复旦大学,集成电路工程,2012,硕士.
[14]夏禾.基于Android智能手机的试卷评阅系统的设计与实现[D].西南交通大学,教育技术学,2014,硕士.
[15]岳亚伟.基于弱监督空间金字塔模型的图像分类研究[D].山东大学,计算机系统结构,2013,硕士.
[16]胡鑫.相信生命及其教育价值[D].首都师范大学,教育学原理,2014,硕士.
[17]卢锌祥.旋前外旋型踝关节骨折两种外固定体位临床疗效研究[D].福建中医药大学,中医骨伤科学,2014,硕士.
[18]颜梦艺.格非“乌托邦”三部曲的精神分析学解读[D].湖南师范大学,中国现当代文学,2014,硕士.
[19]魏骐.Narcotrend麻醉深度监测仪在全凭静脉麻醉中的应用[D].吉林大学,临床医学,2014,硕士.
[20]郭守娇.基于生物酶的真丝功能改性[D].苏州大学,纺织化学与染整工程,2013,硕士.
[21]张召.支持向量机在中医指症数据挖掘中的应用研究[D].华东师范大学,2003.
[22]李列文.FPGA低功耗设计相关技术研究[D].中南大学,计算机科学与技术,2014,博士.
[23]游震.政府推进国有企业社会责任建设的作用研究[D].湖北工业大学,政治学理论,2013,硕士.
[24]冯峰.siRNA抑制ZNF139对人胃癌裸鼠原位移植瘤细胞凋亡影响及机制研究[D].河北医科大学,外科学,2013,硕士.
[25]庞海东,杨尊先,郭太良.CNTs/MnO_x@C一维壳核纳米复合材料的制备及其锂电性能研究[J].真空科学与技术学报,2014,12:1386-1392.
[26]唐秋远.中国民主社会党的宪政探索[D].华中师范大学,中国近现代史,2013,硕士.
[27]张磊.中国国家建设的空间战略[D].复旦大学,政治学理论,2012,硕士.
[28]史源.骨髓间充质干细胞对胰腺导管腺癌免疫抑制作用的研究[D].复旦大学,外科学,2012,硕士.
[29]金晶,张满成,马艳,周庆,李爱民.磁性固相萃取在环境分析中的应用[J].环境保护科学,2015,01:90-94.
[30]廖凤兰.《劳动合同法》对外资企业劳务派遣员工的影响研究[D].西南大学,企业管理,2014,硕士.
[31]吕闰生.受载瓦斯煤体变形渗流特征及控制机理研究[D].中国矿业大学(北京),地质工程,2014,博士.
[32]张健.精益管理在提升手术室效率中的应用研究[D].西南交通大学,工商管理,2013,硕士.
[33]李中华.X地产公司知识型员工的激励方案设计[D].山东大学,工商管理(专业学位),2012,硕士.
[34]黄群.中学地理活动课程的研究[D].华东师范大学,教育,2003,硕士.
[35]崔龙.基于HART总线的气体报警仪的硬件实现[D].杭州电子科技大学,电路与系统,2014,硕士.
[36]王军,王满满,杨许召,邹文苑,陈翔,宋浩.1-(吡啶鎓基)-5-(1-甲基哌啶鎓)戊烷双三氟磺酰亚胺盐的合成与热力学性质研究[J].郑州轻工业学院学报(自然科学版),2014,05:12-16.
[37]伍俊艺.吉林玉米带黑土高产土壤的酶活性特征研究[D].吉林农业大学,农业资源利用,2012,硕士.
[38]王锋堂.地球重力场模型(EGM96)三维可视化[D].首都师范大学,自然地理学,2004,硕士.
[39]吴玮琦,席裕庚,耿晓军.广义预测控制的鲁棒化改进[J].控制与决策,1999,06:663-668.
[40]许秋侠.苯丙氨酸类小分子有机凝胶剂的制备及其荧光传感性质研究[D].吉林大学,有机化学,2014,硕士.
[41]张世铭.浙西燕山期成岩构造背景及桐村钼(铜)矿床成矿过程[D].成都理工大学,矿产普查与勘探,2013,硕士.
[42]高汉华.川芎嗪对肺动脉高压影响的实验与临床研究[D].南方医科大学,临床医学(专业学位),2014,博士.
[43]朱洪.转铁蛋白受体在非小细胞肺癌中的表达及其机制的研究[D].中南大学,外科学,2014,博士.
[44]朱建宁.甘肃省报春花科植物系统分类与区系地理[D].甘肃农业大学,植物学,2013,硕士.
[45]赵建华,沈永良.一种自适应PID控制算法[J].自动化学报,2001,03:417-420.
[46]李娜.乔治·克拉姆《四个月亮之夜》创作技法分析[D].西安音乐学院,作曲与技术理论,2013,硕士.
[47]杨风雷.江苏省非从业居民医疗保险制度评价与整合研究[D].浙江财经学院,社会保障,2013,硕士.
[48]王冬明.塔式起重机空间结构动力学分析及动态监测技术研究[D].太原科技大学,机械设计及理论,2014,硕士.
[49]王金章,李继学,郎世俊.微型机控制的一米七热连轧机快速抗扰动调节系统[J].冶金自动化,1985,06:11-15+62.
[50]梁梅莉.纳米复合结构光电特性的优化设计与实验研究[D].哈尔滨工业大学,光学,2014,硕士.

相关推荐
更多